بهبود عملکرد دسته بندی متون و اسناد فارسی با استفاده از روش pca و ترکیب الگوریتم های جستجوی تکاملی
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر
- author هادی رمضانی
- adviser احمد فراهی
- publication year 1392
abstract
با وجود حجم بالای اطلاعات متنی، نیازمند سیستمی کارا جهت دسته بندی خودکار متون داریم. بنابراین، باید دسته بندی را طوری انجام داد که ضمن افزایش دقت، سبب کاهش زمان و هزینه شود. فرایند دسته بندی متون دارای گامهای پیش پردازش، وزن دهی، کاهش ویژگی و دسته بندی است که برای هر گام روشهای مختلفی تا کنون ارائه شده است. یکی از گامهای تعیین کننده در دسته بندی، کاهش ویژگیها است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است.
similar resources
ارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
full textارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
full textدسته بندی اهداف سوناری با استفاده از روش ترکیبی ازدحام ذرات و جستجوی گرانشی
با توجه به خصوصیات فیزیکی بسیار نزدیک اهداف واقعی و کلاترِ سونار فعال، تفکیک این اهداف، از موضوعات چالشبرانگیز محققان و صنعتگران حوزه آکوستیک میباشد. شبکههای عصبی چندلایه (MLP) یکی از پرکاربردترین شبکههای عصبی در دستهبندی اهداف دنیای واقعی هستند. آموزش از مهمترین بخشهای توسعه این نوع شبکه ها است که در سالهای اخیر بسیار مورد توجه قرار گرفته است. به منظور آموزش شبکههای MLP از دیر باز استف...
full textThe Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad
کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...
full textThe effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2
كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...
full textبهینهسازی فرایند ترکیب تصاویر با استفاده از الگوریتم جستجوی گرانشی
از آنجا که به دلیل محدودیتهای عکسبرداری نمیتوان با گرفتن تنها یک عکس از یک صحنه به تصویری با کیفیت و وضوح مطلوب دست یافت، ترکیب تصاویر با استفاده از روشهای گوناگون روز به روز در حال گسترش و بهبود است. از طرفی امروزه از الگوریتمهای جمعیتی مبتنی بر تصادف جهت بهینهیابی استفاده گستردهای میشود که اغلب با الهام از فرایندهای فیزیکی یا رفتارهای موجودات به وجود آمدهاند. الگوریتم بهینهیابی جست...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023